深度研究

这里说的深度研究（deep research）类工具产品，属于AI Agent的范畴，它是指以基座大模型的能力为基础，基于用户提出的研究课题或主题，自动规划研究方法和步骤，然后通过对网上相关信息和内容进行深度检索和分析，最终生成详细研究报告。

这类工具产品能够很好地帮助我们快速了解某一个领域或主题的相关信息和知识，可能是目前我觉得AI应用最有潜力的一个合法领域，随着产品的不断成熟，有可能成为AI的第一个“打手级”（杀手级好像还到不了）应用。

最早推出的深度研究（deep research）类工具产品的是Google在2024年年底推出的Gemini Deep Research，随后OpenAI于2025年2月面向其Pro用户推出OpenAI deep research，之后国外多个大模型厂商如xAI（Grok）、Anthropic（Claude）、Perplexity也逐步推出类似功能。

值得一提的是，OpenAI在2025年4月25日宣布其免费ChatGPT用户每个月可以使用5次deep research轻量级版本，终于让普通用户也可以体验到“地表最强”大模型的深度研究能力了。 Pasted image 20250501101657

本文试用的深度研究类工具产品包括：OpenAI deep research轻量版（下称ChatGPT）、Gemini Deep Research（下称Gemini）、Grok DeeperSearch（下称Grok）、Perplexity Research（下称Perplexity）、秘塔AI搜索-研究（下称秘塔）、智谱清言AutoGLM沉思（下称智谱）。本文试用的深度研究类工具产品均为免费用户版本，由于Claude的深度研究类产品仅供付费用户使用，所以未在本次试用范围之类。

研究主题

最近看了一篇Google DeepMind CEO Demis Hassabis的访谈报道，他预测具备人类水平认知能力的AGI将在5-10年到来，这让我对AI领域权威人士预测AGI的话题产生了极大的兴趣，本来想着网上搜索一番，看看还有哪些“大嘴”做过类似的预测，突然想起各家的深度研究功能，于是正好借这一问题对比看看各家的报告产出质量如何。

以下为对各深度研究产品的输入信息（研究要求），由于试用的先后顺序，输入信息在细节上可能会有一点差异，但不影响最终结果的呈现。

“全面梳理一下截止到目前为止一年内，AI领域的权威人士对于AGI什么时候到来的预测，需要明确清楚相关人员的个人教育和职业背景、做出预测的时间、预测AGI到来的时间以及做出预测的相关判断依据或其他背景信息，最后表达你对这一问题的看法和意见。”

总体感受

第一梯队：ChatGPT轻量版胜在精准，毫无冗余信息，Gemini胜在全，但关键信息有所不足。 第二梯队：Perplexity和Grok收集信息量不足，但在分析深度上Perplexity略高于Grok；秘塔有点魔怔，时间都是错的，本来应该排在最后，但是仔细看完智谱的内容后发现智谱是最差的，秘塔的专家人数还可以，呈现内容中规中矩，不考虑时间错误的话，和Perplexity和Grok可以打个有来有回。 第三梯队：智谱的定位应该也是接近深度研究的，所以生成的结果很具有欺骗性，看起来篇幅很多内容很丰富，但其实质量很有问题，需要他说的不好好说，没让他说的发挥一大堆。

ChatGPT轻量版 > Gemini >＞＞Perplexity＞Grok＞秘塔＞智谱

基于以上评估，后续使用深度研究功能时，优先使用ChatGPT、Gemini和秘塔生成相关内容，Perplexity、Grok还有智谱清言保持关注。

研究结果

ChatGPT

截图

Pasted image 20250501110404

ChatGPT

预测人员列表

姓名	教育背景	职业背景	预测时间	预测AGI到来时间
Sam Altman	斯坦福大学肄业（计算机）	OpenAI CEO，前YC总裁	2024年12月	2025–2029（特朗普任期内）
Demis Hassabis	剑桥大学CS本科，UCL神经科学博士	DeepMind CEO	2025年4月	2030–2035（5–10年内）
Elon Musk	宾大经济+物理学士	特斯拉/SpaceX CEO，xAI创始人	2024年4月	2025–2026
Dario Amodei	普林斯顿数学博士	Anthropic CEO，前OpenAI研究主管	2024年11月	2026–2027
Jensen Huang（黄仁勋）	交大电子学士，斯坦福硕士	NVIDIA CEO	2024年3月	2029前
Mustafa Suleyman	牛津大学PPE学士	微软AI负责人，前DeepMind联合创始人	2024年12月	2030–2032（5–7年）
李开复	哥伦比亚大学CS学士，卡耐基梅隆博士	创新工场&零一万物创始人	2024年11月	2031左右（7年）
张鹏	蒙特利尔大学CS学士，MIT硕士	智谱AI CEO	2024年4月	未明示（认为2024是冲刺元年）
倪贤豪	兰州大学CS本科，清华访学	智源研究院战略负责人	2024年12月	2027前（3年内）

评价

优点1：对于用户要求中不太明确的地方，能够通过与用户的交互进行明确，就像一个有独立思考能力的下属，对于上级布置的任务懂得通过提问来使任务更清晰。
优点2：输出内容整体质量最高，对于权威人士的预测，从教育背景、职业背景、预测时间、预测结果和预测依据几个角度给出了清晰的信息，尤其是在预测时间上还具体说明了是在接受哪个媒体哪个节目的采访时说的，有鼻子有眼，可信度大幅增加。
缺点：可能是轻量版的缘故，专家数量和内容篇幅上相对少了一点，少了2024年诺贝尔物理学奖获得者、“AI教父”杰弗里·辛顿（Geoffrey Hinton）不太应该，完全版的内容可能会更扎实一点吧。

Gemini

截图

Pasted image 20250501111237

Gemini

预测人员列表

专家姓名	机构/职位	预测日期（来自Snippet）	预测AGI到来时间
萨姆·奥特曼（Sam Altman）	OpenAI首席执行官	2024年12月/2025年1月	2025年/5-8年
伊隆·马斯克（Elon Musk）	特斯拉/X负责人，OpenAI联合创始人	2025年3月	2025年/2026年
达里奥·阿莫代伊（Dario Amodei）	Anthropic首席执行官	2025年1月/2025年3月	2026年/2027年
沙恩·莱格（Shane Legg）	Google DeepMind联合创始人兼首席AGI科学家	2025年3月	2028年
德米斯·哈萨比斯（Demis Hassabis）	Google DeepMind首席执行官	2025年1月/2025年3月	至少10年/5-10年
扬·勒昆（Yann LeCun）	Meta首席AI科学家	2025年1月/2025年3月	5-6年/3-5年/10年内
杰弗里·辛顿（Geoffrey Hinton）	多伦多大学名誉杰出教授	2025年3月/2025年3月	10年内（可能导致人类灭绝）/5-20年
雷·库兹韦尔（Ray Kurzweil）	谷歌首席未来学家	2025年2月/2025年3月	2029年
孙正义（Masayoshi Son）	软银首席执行官	2025年2月/2025年2月	2026-2027年/10年内（ASI）
尼古拉·尤尔科维奇（Nikola Jurkovic）	哈佛大学	2025年2月/2025年4月	2027年
约翰·舒尔曼（John Schulman）	Anthropic研究员，OpenAI联合创始人	2025年2月	2027年（AGI）/2029年（ASI）
伊利亚·苏茨克维尔（Ilya Sutskever）	OpenAI联合创始人兼首席科学家	2025年3月/2024年12月	未明确给出，但强调预训练终结
李飞飞	斯坦福大学教授	2025年3月/2024年7月	未明确给出
格雷格·布罗克曼（Greg Brockman）	OpenAI总裁	2025年2月/2025年3月	2025年（AI代理）/2024年（突破）
佩德罗·多明戈斯（Pedro Domingos）	华盛顿大学名誉教授	2024年3月	3-8年

评价

优点1：篇幅最多，报告中既有文字说明又有表格汇总，既有前情介绍也有后续分析。
优点2：涉及到的英文领域人员最全，AI大厂如OpenAI、xAI、Anthropic、Google DeepMind、Meta等的大佬都涵盖了，2024年诺贝尔物理学奖获得者、“AI教父”杰弗里·辛顿也在列。不过就是少了前DeepMind联合创始人、现微软AI负责人Mustafa Suleyma有点奇怪。
缺点1：虽然有先提供研究方案让用户进行确定，但比起ChatGPT通过提问的方式明确研究要点还是要略逊一点点，比如研究方案没有提到专家来源，最后默认是英文领域专家。
缺点2：从专家简介、预测时间、预测依据及相关信息、相关Snippet ID、分析等几个维度对每个专家的介绍，但无视教育背景的信息要求。
缺点3：信息明显没有ChatGPT更精准更切题，反而是篇幅都花在其他周边信息上，可能跟Gemini deep research的大而全的定位有关？

Grok

截图

Pasted image 20250501110653

Grok

预测人员列表

专家姓名	教育与职业背景	预测时间	AGI到来的时间
Sam Altman	OpenAI CEO，前Y Combinator总裁，计算机科学与创业背景	2024年晚期	2025年
Ajeya Cotra	Open Philanthropy高级研究员，UC Berkeley电气工程与计算机科学学士	2025年	中位数2038年，25%概率2028-2029年
Dario Amodei	Anthropic CEO，前OpenAI研究员，Princeton物理学博士	2024年	2026年
Shane Legg	Google DeepMind联合创始人兼首席AGI科学家，AI博士	2024年重申	50%概率2028年
Geoffrey Hinton	University of Toronto教授，前Google研究员，神经网络领域先驱	2024年	2029-2044年
Demis Hassabis	DeepMind联合创始人兼CEO，认知神经科学博士	2025年	2030-2035年

评价

优点：没有明显优点。
缺点1：整体来说偏简洁了一点，专家数量也不够多，居然能少了自己的老板也是有点个性。但简洁可能是定位的原因，再deeper的search也还是定位为search，并没有想往research报告上面硬凑。
缺点2：从背景、预测时间与内容、判断依据和背景信息几个角度进行分析，但是背景信息这个维度不知所云。

Perplexity

截图

Pasted image 20250501110851

Perplexity

预测人员列表

权威人士	教育背景	职业背景	预测时间	预测AGI实现时间
Sam Altman	斯坦福大学计算机科学辍学	Loopt创始人，Y Combinator总裁，OpenAI CEO	2024年12月	2025年首批AGI应用案例
Dario Amodei	斯坦福大学理论物理博士	Google Brain研究员，OpenAI安全负责人，Anthropic CEO	2025年4月	2026-2027年
Mustafa Suleyman	牛津大学哲学与神学学士	DeepMind联合创始人，Inflection AI CEO，微软AI负责人	2025年4月	2030-2032年
Geoffrey Hinton	剑桥大学心理学学士，爱丁堡大学AI博士	卡内基梅隆大学教授，多伦多大学教授，Google Brain顾问	2025年2月	5-20年内
Yoshua Bengio	麦吉尔大学计算机科学博士	MIT博士后，蒙特利尔大学教授，Mila研究院创始人	2025年2月	1-10年内

评价

优点：教育背景信息单列。
缺点：Perplexity研究和深度研究可能还是有区别，整体来说偏简洁了一点，专家数量也不够多，少了xAI和DeepMind的大佬不太应该。

智谱

截图

Pasted image 20250501111035

智谱

预测人员列表

没有生成表格，略过。

评价

缺点1：内容庞杂，感觉是想对标Gemini，但是梳理出的专家不足，少了Anthropic和微软AI负责人。
缺点2：输出内容很多，但在关于AGI的其他话题上面发挥过度，如AGI实现路径分析、AGI实现时间预测趋势、AGI实现的社会影响和调整等，这些并不是我的诉求，明显是模型为了撑内容在过度发挥。
缺点3：关键核心信息不足，呈现内容提炼总结不够，大量引用文字，如下图所示，毫无结构化呈现效果。

秘塔

截图

Pasted image 20250501110941

秘塔

预测人员列表

姓名	职位/背景	预测时间	预测内容
Sam Altman	OpenAI CEO；斯坦福大学计算机科学辍学；主导ChatGPT和GPT-4开发	2024年初、2024年12月	5年内实现AGI；未来12个月或有重大突破
李彦宏	百度CEO；北京大学信息管理学士；布法罗纽约州立大学计算机硕士；中国AI商业化领军者	2024年5月	AGI需要至少10年
Demis Hassabis	DeepMind CEO；剑桥大学计算机科学双学位；AlphaGo和AlphaFold核心开发者	2025年1月	5-10年实现AGI，需2-3项关键突破
李开复	创新工场CEO；卡内基梅隆大学计算机博士；零一万物创始人	2024年12月	2030年实现AGI
吴恩达	斯坦福教授；MIT博士；“Google大脑”创始人	2023年、2024年8月	严格AGI需30-50年；若放宽标准或缩短至1-2年
Geoffrey Hinton	多伦多大学教授；剑桥大学实验心理学博士；深度学习三巨头之一	2023年	5-20年内实现AGI
李飞飞	斯坦福大学教授；ImageNet创始人；普林斯顿大学物理学士	未直接预测时间	三维空间智能是AGI必要条件
Yoshua Bengio	蒙特利尔大学教授；图灵奖得主；注意力机制提出者	2023年、2024年	几十年内实现；调整为“几年到几十年”
马斯克	特斯拉CEO；Neuralink和xAI创始人；宾夕法尼亚大学物理和经济学双学位	2024年	2026年出现AGI
黄仁勋	英伟达CEO；斯坦福大学电子工程硕士；GPU架构革命领导者	2024年	5年内AI通过所有人类测试

评价

优点：中英文人士都有，国内内容相对会多一点。
缺点1：时间不知道为啥很混乱，试了两次都是这样。
缺点2：专家少了Anthropic和微软AI负责人，但不算大问题。

兴之所志

2025-05-01

横向对比几家大模型厂商的深度研究（deep research）类工具产品

深度研究

研究主题

总体感受

研究结果

ChatGPT

截图

预测人员列表

评价

Gemini

截图

预测人员列表

评价

Grok

截图

预测人员列表

评价

Perplexity

截图

预测人员列表

评价

智谱

截图

预测人员列表

评价

秘塔

截图

预测人员列表

评价